“Word alignment(词对齐)”指在双语文本(如英语-中文的平行语料)中,确定源语言句子里的词与目标语言句子里哪个词(或词组)在意义/翻译上相对应的过程。它常用于机器翻译、双语词典抽取、翻译质量分析等领域。(也可扩展到短语对齐或子词对齐等。)
/ˈwɝːd əˈlaɪnmənt/
Word alignment helps the system learn how words translate between two languages.
词对齐帮助系统学习两种语言之间词语如何互相翻译。
Accurate word alignment is crucial for training statistical machine translation models, especially when the word order differs across languages.
准确的词对齐对训练统计机器翻译模型非常关键,尤其是在不同语言语序差异较大时。
“Alignment”来自法语 aligner(使成一线、对齐),其核心含义是“把事物按对应关系排齐”。在计算语言学中,“word alignment”把“对齐”的空间含义借用到语言对应上,强调跨语言单位之间的匹配关系。